ابهام زدایی از واژگان مبهم و دارای معانی متعدد، موضوع مهمی در حوزه پردازش زبان های طبیعی است. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی با استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با به کار بردن روش های مدل سازی موضوع به دست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده موضوع های موجود در اسناد یک پیکره است. در مقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله (LDA) برای این منظور استفاده کرده ایم. نتایج آزمایش ها برای پانزده واژه مبهم پرتکرار در زبان فارسی که از پیکره پژوهشکده پردازش هوشمند علائم استخراج شد، دقت حدود 97% را نشان می دهد که بیان گر تاثیر این روش در یافتن معنی مناسب واژگان مبهم است.